我在html文档解析中看到了这个正则表达式.
我知道它与
元素匹配,但我不确定[^>]*>
部分.据我所知,正则表达式说元素应该以"br"开头,但为什么它们需要[^>]*>
部分.他们为什么不用
?
[]表示一组字符.如果[]以^开头,则表示除了这些字符之外的任何内容.所以 [^>]*>
将匹配"除了>之外的任何东西的多个字符,然后是>"这用于吃掉br和>之间的任何东西
这是正则表达式的完整细分<br[^>]*>
:
<br
字面匹配字符
匹配任何不是的字符 >
在零和无限次之间,尽可能多次,根据需要回馈(贪婪)
>
字面匹配字符
另外,你<br*>
在帖子中提到了正则表达式.
这实际上会匹配<b
,然后匹配r
'在零和无限时间之间',然后是>
.